You are viewing the community [info]ru_ir

Информационный поиск [entries|archive|friends|userinfo]
Информационный поиск

[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

RuSSIR: последний шанс [May. 17th, 2012|10:27 am]

l_i_d_y_a
[Tags|]

Осталась всего неделя до конца приема заявок на RuSSIR.

Между тем, на сайте школы опубликована окончательная программа: http://romip.ru/russir2012/section.php?id=127

Напоминаем, что основной темой этого года стали многоязычные приложения. А в самом начале школы будет проведен мини-курс "Ведение в информационный поиск".
Link1 comment|Leave a comment

Анализ текста на естественном языке, управляемый вариантами разбора [May. 16th, 2012|08:36 pm]

nataxane
[Tags|]

Уважаемые коллеги,

19 мая состоится заключительный семинар по автоматической обработке естественного языка в этом сезоне.

С докладом на тему "Анализ текста на естественном языке, управляемый вариантами разбора" выступит аспирант факультета вычислительной математики и кибернетики МГУ Алексей Носков.

Общепринятой схемой обработки теста на естественном языке (ЕЯ) является последовательность независимых этапов его анализа на основных уровнях, включая графематический, морфологический и синтаксический анализ. На каждом этапе в общем случае возникают многочисленные варианты разбора отдельных единиц текста, окончательный выбор между которыми часто может быть сделан только на последующих этапах, что представляет одну из сложностей обработки ЕЯ и приводит к появлению промежуточных этапов, таких как постморфология.
В докладе рассматривается подход к обработке текстов на ЕЯ, в рамках которого варианты разбора, возникающие на основных этапах анализа, обрабатываются последовательно, а сами этапы анализа выполняются одновременно. Подход иллюстрируется реализацией поверхностно-синтаксического анализа текста по лингвистическим шаблонам, подобным шаблонам языка LSPL (www.lspl.ru) и языка JAPE (системы GATE: www.gate.ac.uk).

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.
Пароль для прохода через вахту: "Я на семинар".
LinkLeave a comment

RCDL 2012 [May. 15th, 2012|11:01 am]

itman
[Tags|]

Наступила последняя неделя приёма расширенных тезисов докладов на XIV Всероссийскую научную конференцию RCDL-2012
"Электронные библиотеки: перспективные методы и технологии, электронные коллекции", которая пройдёт в г. Переславль-Залесский, 15 - 18 октября 2012 года.


Каждая работа будет тщательно изучена и отрецензирована несколькими членами программного комитета. Не позднее 24 июня программный комитет сообщит Вам о своём решении. В случае принятия доклада Вы сможете за лето подготовить окончательную публикацию по шаблонам в форматах DocX, ODT и LaTeX, доступным с сайта конференции.

Очень надеемся на Ваше понимание и участие.

Подробная информация о конференции представлена на нашем веб-сайте http://rcdl2012.pereslavl.ru.

Мы будем признательны, если Вы проинформируете своих коллег о возможности участия в нашей конференции.

При возникновении любых затруднений просим обращаться по указанным на сайте адресам.

Сопредседатели программного комитета

Сергей Витальевич Знаменский
Михаил Рувимович Когаловский
LinkLeave a comment

Семинар Михаила Агеева «Моделирование успешного поиска на основе поведения пользователя» [May. 11th, 2012|10:32 am]

itman
Семинар состоится 23 мая 2012 года в московском офисе Яндекса.

В рамках Цикла научных семинаров выступит Михаил Агеев, кандидат физико-математических наук (с 2005 г.), старший научный сотрудник научно-исследовательского вычислительного центра МГУ им. М.В.Ломоносова.

Работа, в которой Михаил был основным автором получила приз, как лучшая работа на SIGIR 2011.
LinkLeave a comment

История Информационного Поиска [May. 9th, 2012|02:20 pm]

itman
[Tags|, ]

Первая автоматическая информационно поисковая система была реализована в 20-х годах прошлого столетия. Продолжение...
LinkLeave a comment

Real-world text mining using machine learning [Apr. 16th, 2012|08:35 pm]

nataxane
[Tags|]

Дорогие коллеги!

В ближайшую субботу, 21 апреля, на семинаре по автоматической обработке естественного языка выступит профессор Ян Жижка (Чехия).

Ян прочтет доклад на тему "Real-world text mining using machine learning". Продолжительность доклада - 3 часа. Внимание - семинар будет проходить на АНГЛИЙСКОМ языке.

Аннотация:
Today, huge volumes of text data are available, especially on the Internet. Very often, the data is not structured and the text is freely written by the Internet users in natural languages. Such the data is expected to contain interesting or valuable information that can be used for different goals in a lot of application areas. Because the data is too big, it is very difficult or impossible to process it "manually" within an acceptable time. Fortunately, modern informatics procedures and methods enable us to apply sophisticated methods included in artificial intelligence, especially the set of algorithms called machine learning. Machine learning methods applied to text mining are based on the inductive learning from existing examples.

In the first part, the talk deals with a brief introduction to some machine learning methods applied to text mining. The main problems are connected with the appropriate preprocessing of the data, designing the mining procedure including selection of suitable algorithms and interpreting the results.

In the second part, some interesting results obtained from the real-world data will be presented. The data represents opinions/sentiments of customers' reviews relating to services provided by hotel accommodation all over the world. The reviews are written by hundreds of thousands of customers in many languages. The focus of the described research was on revealing typical words and phrases in several languages, including English, Spanish, French, German, Japanese, Russian, Czech, and others.

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.
Пароль для прохода через вахту: "Я на семинар".
LinkLeave a comment

Преобразование структур зависимостей [Apr. 4th, 2012|05:03 pm]

nataxane
[Tags|]

Уважаемые коллеги,

В ближайшую субботу, 7 апреля, в 17:00 состоится очередной семинар по автоматической обработке естественного языка.

Ангелина Иванова (University of Oslo) представит доклад на тему "Преобразование структур зависимостей".

Инициативой DELPH-IN разработан синтаксически размеченный корпус LinGO Redwoods. Корпус аннотирован вручную в рамках формальной грамматики LinGO English Resource Grammar. Каждое предложение снабжено двумя видами древовидных структур: (1) синтаксическим деревом (DELPH-IN derivation tree), (2) семантическим графом зависимостей в формате Minimal Recursion Semantics - MRS. Для того, чтобы ресурс можно было использовать для задач синтаксического анализа с помощью различных парсеров, необходимо обеспечить его совместимость с общепринятыми схемами представления синтакто-семантических зависимостей. С этой целью ведется работа над автоматическим конвертером, который преобразует HPSG-структуры в структуры зависимостей, представляющие отношения между отдельными словами. Конвертер трансформирует синтаксические деревья и семантические графы независимо.
Доклад будет посвящен описанию конвертера и сравнительному анализу полученных представлений с наиболее известными схемами зависимостей (CoNLL,Stanford, EnjuPredicate - Argument Structures).

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308.
Пароль для прохода через вахту: "Я на семинар".
LinkLeave a comment

RUSSIR и конференция молодых ученых призывают участников! [Mar. 27th, 2012|11:06 am]

itman
[Tags|]

Подробности по ссылке.
Link1 comment|Leave a comment

инженерия гуманитарного знания: магистратура [Mar. 26th, 2012|09:12 am]

l_i_d_y_a
[Tags|, ]

Кафедра информационных систем  в искусстве и гуманитарных науках СПбГУ в рамках направления 230700 «Прикладная информатика» открывает прием в магистратуру по образовательной программе «Инженерия гуманитарных знаний».

Срок обучения 2 года. Обучение завершается защитой магистерской диссертации.

Учебный план предусматривает, в том числе, следующие курсы: «Методы и модели онтологической инженерии», «Системы понимания текста» «Модели анализа текста и их программная реализация», «Статистические методы в языковой инженерии», «Корпусные методы в языковой инженерии», «Лингвистика текста и теория речевой коммуникации», «Методы программной реализации интеллектуальных информационных технологий».

В 2012 планируется второй набор студентов в магистратуру. Обучение на бюджетной (пять мест) и коммерческой основе.

В настоящее время обучение проходят четверо студентов, планируется защита диссертаций по следующим темам:

1. Автоматизация выбора параметров для лингвистически адекватного извлечения коллокаций
2. Распознавание именованных сущностей методами машинного обучения
3. Анализ кореференции в задаче извлечения информации
4. OWL-конвертирование онтологий (на примере онтологии IntTez)

К преподаванию привлечены ведущие преподаватели  СПбГУ, а также  специалисты, практически работающие в известных научных и коммерческих организациях.

Подробности о магистратуре можно узнать на нашем сайте.

Также приглашаем всех интересующихся на презентацию магистратуры, которая пройдет 27 апреля в 15.00, по адресу СПб, 10-я линия В.О., д. 49 ауд. 308

Link4 comments|Leave a comment

Анализ естественного языка в моделировании требований для CASE-технологий [Mar. 22nd, 2012|12:57 pm]

nataxane
[Tags|]


Уважаемые коллеги,

В субботу, 24 марта, состоится очередной семинар по автоматической обработке естественного языка.

С докладом на тему "Анализ естественного языка в моделировании требований для CASE-технологий" выступит Вадим Нуриахметов (ТулГУ).

В докладе излагается подход к решению задачи построения всех понятий на формальном контексте. Данный подход основывается на применении концептуальных графов. Это позволяет для текстов на естественном языке строить конкретные контексты пониженной размерности и находить на них понятия, выявляя в тексте объекты и их атрибуты. Данный подход снижает сложность задачи построения понятий. В предложенной работе исследуются концептуальные графы вместе с формальным контекстом, как промежуточная модель между естественным языком и CASE моделью. Они являются дополнительным инструментом в CASE технологиях, который помогает разработчикам информационных систем проектировать CASE модели. В разработанной системе используется специальный генератор концептуальных графов с управляемым алгоритмом генерации шаблонов. Генератор концептуальных графов был успешно испытан на русских и английских текстах.

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.
Пароль для прохода через вахту: "Я на семинар".
Link3 comments|Leave a comment

navigation
[ viewing | most recent entries ]
[ go | earlier ]